資料型別主要有三種,Numerical、Categorical與Ordinal。以下分別跟大家說明:
Numerical Data
數值型的資料,具有數學意義,可以比較大小。Numerical Data又可以再細分為Discrete Data與Continuous Data。
Categorical Data
類別型資料通常有對應的文字,例如學歷、產品類別、性別等。這些文字可透過數字去表示,例如學歷大學以上是1,大學以下是0。但這些數字並不夾帶著大小的數學意義,只是為了後續分析便利性和程式運作來做的轉換。
Ordinal
順序資料算是Numerical與Categorical資料的混合型。最常見的是各種評比分數。例如,觀眾針對某一場演講的評比分數由1到5去做調查。1表示最差,5表示最好,這些數字背後有Categorical對應的意義,同時又有Numerical的數學大小意義。
ChatGPT來出題囉:
情境1:數值型資料(Numerical Data)
你的朋友正在追蹤他的每月儲蓄,以幫助他管理財務。他紀錄了以下信息:一月儲蓄 $500、二月儲蓄 $600、三月儲蓄 $700。這種數據是哪種類型的數值資料?
A) 順序資料(Ordinal Data)
B) 類別型資料(Categorical Data)
C) 連續數值資料(Continuous Numerical Data)
D) 非連續數值資料(Discrete Numerical Data)
答案:D) 非連續數值資料(Discrete Numerical Data)
情境2:類別型資料(Categorical Data)
一家餐廳將其顧客分為三個類別:「素食者」、「葷食者」和「其他」,以了解顧客的飲食偏好。這種顧客分類屬於哪種類型的資料?
A) 順序資料(Ordinal Data)
B) 數值型資料(Numerical Data)
C) 連續數值資料(Continuous Numerical Data)
D) 類別型資料(Categorical Data)
答案:D) 類別型資料(Categorical Data)
情境3:順序資料(Ordinal Data)
一家電影評論網站允許用戶對電影評分,評分分為「極好」(5分)、「很好」(4分)、「普通」(3分)、「不太好」(2分)和「很差」(1分)。這種評分屬於哪種類型的資料?
A) 連續數值資料(Continuous Numerical Data)
B) 類別型資料(Categorical Data)
C) 數值型資料(Numerical Data)
D) 順序資料(Ordinal Data)
答案:D) 順序資料(Ordinal Data)